DARBO APRAŠAS

Pavadinimas: Duomenų Analitikos kursų baigiamasis darbas Studentas: Gediminas Mickevičius

Analizės tema: Finansinių paslaugų gavėjo tipo (asm.duomenų) koreliacija su įsipareigojimų vykdymo kokybe

Tikslai: - Nustatyti kokie kliento profilio parametrai ar jų kombinacijos didina nemokumo riziką

                  - Patvirtinti arba paneigti, kad: 
                      a) "gruodžio, bei sausio mėnesį dažniau grąžinamos skolos" 
                      b) "vyresnės moterys pareigingiau vykdo fin.įsipareigojimus"
                      c) "vedę vyrai rečiau tampa nemokiais" 
                  - Naudojantis Python SCLEARN moduliu sukurti potencialaus kliento mokumo prognozavimo įrankį

Duomenų šaltinis: Realios lietuviškos vartojimo kreditų rinkos bedrovės "nuasmeninti" duomenys, ( 2x .XLSX, 1x.CSV (>1 mln. rows))

Turinys: (Planas_A-B)

  1. Duomenų struktūros, ryšių, kiekybės ir kokybės analizė (Python)
  2. Importavimas iš CSV į MySQL su Python pagalba
    (>1mln įrašų 1 lentelė apie klientų mokėjimus) (MySQL)
  3. Duomenų agregavimas SQL'e (group by, count, sum, max, avg) (MySQL)

(Planas_A+B)

  1. Apjungtų duomenų analizė su Python (Python)
  2. Kliento mokumo prognozavimas (Python)

Duomenų struktūros, ryšių, kiekybės ir kokybės analizė (Python)

image.png

Duomenų semantikos ir pragmatikos analizė

Importavimas iš CSV į MySQL su Python pagalba

image-2.png image.png image-3.png image-4.png

image.png

Duomenų agregavimas SQL'e (group by, count, sum, max, avg) (MySQL)

image.png

Apjungtų duomenų analizė

Išvados:

Patvirtinti arba paneigti, kad: a) "gruodžio, bei sausio mėnesį dažniau grąžinamos skolos" NEPATVIRTINTA... b) "vyresnės moterys pareigingiau vykdo fin.įsipareigojimus" PATVIRTINTA c) "vedę vyrai rečiau tampa nemokiais" PATVIRTINTA